Diagnosticando la confiabilidad del juez LLM: Conjuntos de predicción conformes y violaciones de transitividad
Un estudio sobre la confiabilidad del juez LLM: Conjuntos de predicción y violaciones de transitividad. Descubre cómo se diagnostica la confiabilidad en este contexto.